智能论文笔记

FIRE: A Failure-Adaptive Reinforcement Learning Framework for Edge Computing Migrations

Marie Siew , Shikhar Sharma , Kun Guo , Chao Xu , Tony Q. S. Quek , Carlee Joe-Wong

分类：机器学习

2022-09-28

在边缘计算中，必须根据用户移动性迁移用户的服务配置文件。已经提出了强化学习（RL）框架。然而，这些框架并不考虑偶尔的服务器故障，尽管很少会阻止Edge Computing用户的延迟敏感应用程序（例如自动驾驶和实时障碍物检测）的平稳和安全功能，因为用户的计算作业不再是完全的。由于这些故障的发生率很低，因此，RL算法本质上很难为数据驱动的算法学习针对典型事件和罕见事件方案的最佳服务迁移解决方案。因此，我们引入了罕见的事件自适应弹性框架火，该框架将重要性采样集成到加强学习中以放置备份服务。我们以与其对价值函数的贡献成正比的稀有事件进行采样，以学习最佳政策。我们的框架平衡了服务迁移和迁移成本之间的迁移权衡，与失败的成本以及备份放置和移民的成本。我们提出了一种基于重要性抽样的Q-学习算法，并证明其界限和收敛到最佳性。随后，我们提出了新的资格轨迹，我们的算法的线性函数近似和深Q学习版本，以确保其扩展到现实世界情景。我们扩展框架，以适应具有不同风险承受失败的用户。最后，我们使用痕量驱动的实验表明我们的算法在发生故障时会降低成本。

translated by 谷歌翻译

个性化联合学习允许分布式系统中的客户培训针对其独特本地数据量身定制的神经网络，同时利用其他客户的信息。但是，客户的模型在培训和测试阶段都容易受到攻击。在本文中，我们解决了对抗性客户在测试时间制定逃避攻击的问题，以欺骗其他客户。例如，对手可能旨在欺骗垃圾邮件过滤器和推荐系统，并接受了个性化联合学习培训以获得金钱收益。根据分布式学习的方法，对抗客户具有不同程度的个性化，从而导致“灰色盒子”情况。我们是第一个表征这种内部逃避攻击对不同学习方法的可转移性，并根据客户数据的个性化程度和相似性分析模型准确性和鲁棒性之间的权衡。我们介绍了一种防御机制PFEDDEF，该机制进行了个性化的联合对手培训，同时尊重抑制对抗性培训的客户的资源限制。总体而言，与联邦对抗训练相比，PFEDDEF将相对灰色的对抗鲁棒性提高62％，即使在有限的系统资源下也表现良好。

translated by 谷歌翻译

在本文中，我们研究了组合半伴侣（CMAB），并专注于减少遗憾的批量$ k $的依赖性，其中$ k $是可以拉动或触发的武器总数每个回合。首先，对于用概率触发的臂（CMAB-T）设置CMAB，我们发现了一个新颖的（定向）触发概率和方差调制（TPVM）条件，可以替代各种应用程序的先前使用的平滑度条件，例如级联bandsistits bandits bandits。，在线网络探索和在线影响最大化。在这种新条件下，我们提出了一种具有方差感知置信区间的BCUCB-T算法，并进行遗憾分析，将$ O（k）$ actival降低到$ o（\ log k）$或$ o（\ log^2 k））$在遗憾中，大大改善了上述申请的后悔界限。其次，为了设置具有独立武器的非触发CMAB，我们提出了一种SESCB算法，该算法利用TPVM条件的非触发版本，并完全消除了对$ k $的依赖，以备受遗憾。作为有价值的副产品，本文使用的遗憾分析可以将几个现有结果提高到$ O（\ log K）$的一倍。最后，实验评估表明，与不同应用中的基准算法相比，我们的表现出色。

translated by 谷歌翻译

传统上，群集联合学习组客户端具有与群集相同的数据分发，以便每个客户端都与一个数据分发唯一关联，并帮助为此分发训练模型。我们将此艰难的关联假设放宽到软群集联合学习，允许每个本地数据集遵循多个源分布的混合。我们提出FEDSoft，在此设置中列出了本地个性化模型和高质量的集群模型。FEDSoft通过使用近端更新限制客户端工作负载，以便在每个通信中只需要从客户端的子集完成一个优化任务。我们在分析和经验上显示，FedSoft有效利用源分布之间的相似性，以了解表现良好的个性化和群集模型。

translated by 谷歌翻译